214 research outputs found

    Utilization of statistical techniques in two journals of fruticulture

    Get PDF
    Neste trabalho são descritas as técnicas de análise estatística utilizadas e a acessibilidade estatística em uma amostra dos artigos originais publicados no período 1996-2006 em duas revistas de pesquisa na área de fruticultura: a Revista Brasileira de Fruticultura (RBF) e a revista francesa Fruits. No total foram classificados 986 artigos em 16 categorias de análise estatística, ordenadas em grau ascendente de complexidade. No período analisado, foi constatado um aumento no uso de análises mais sofisticadas ao longo do tempo em ambos as revistas. Os trabalhos publicados pela RBF aplicaram com maior freqüência técnicas estatísticas mais complexas, com maior utilização de delineamentos em blocos aleatorizados, arranjos fatoriais, parcelas subdivididas e modelos hierárquicos, e do teste de Tukey para comparações múltiplas de médias. Nos trabalhos publicados pela revista Fruits, predominou o uso de outros testes paramétricos e do teste de Duncan. O pacote estatístico SAS foi o mais utilizado nos artigos publicados em ambas as revistas. Os leitores da revista RBF precisaram de um nível de conhecimento estatístico mais elevado para ter acesso à maior parte dos artigos publicados no período, em comparação com os leitores da revista francesa.The statistical techniques and statistical accessibility were analyzed in a sample collected from the original articles published between 1996 and 2006 by two fruticulture journals: the Revista Brasileira de Fruticultura (RBF) and the French journal Fruits. A total of 986 original articles were classified in 16 classes of statistical analyses, previously ordered by increasing degree of complexity. The complexity of statistical techniques used by both journals increased in time. Along the 1996-2006 period, the articles published in the RBF journal utilized more complex statistical techniques, as well as experimental designs in randomized blocks, factorial, split plot and hierarchical arrangements, and the test of Tukey for mean comparisons. In the articles published by the Fruits journal the use of other parametrical tests and the Duncan test was more frequent. In both journals the SAS statistical software was most frequently utilized. Readers of the RBF journal required a higher level of statistical knowledge to understand the techniques utilized in the articles

    Escolha de componentes nos modelos de efeitos principais aditivos e interação multiplicativa (AMMI)

    Get PDF
    The additive main effect and multiplicative interaction (AMMI) models allows analysts to detect interactions between rows and columns in a two-way table. However, there are many methods proposed in the literature to determine the number of multiplicative components to include in the AMMI model. These methods typically give different results for any particular data set, so the user needs some guidance as to which methods to use. In this paper we compare four commonly used methods using simulated data based on real experiments, and provide some general recommendations.Os modelos de efeitos principais aditivos e interação significativa (AMMI) permitem ao analista detectar interações entre linhas e colunas em uma tabela de dupla entrada. Entretanto, existem muitos métodos propostos na literatura para determinar o número de componentes multiplicativos a incluir nos modelos AMMI. Esses métodos fornecem diferentes resultados para um particular conjunto de dados. Assim, o usuário necessita de orientação sobre quais métodos usar. Nesse trabalho investigamos quatro métodos comumente utilizados em um amplo espectro de condições usando dados simulados baseados em dados de ensaios reais. O método de Eastment-Krzanowski apresentou melhor desempenho; cada um dos outros métodos exibiram baixo desempenho em alguma das situações estudadas

    Imputação múltipla livre de distribuição em matriz de interação por meio de decomposição por valor singular

    Get PDF
    Some techniques of multivariate statistical analysis can only be conducted on a complete data matrix, but the process of data collection often misses some elements. Imputation is a technique by which the missing elements are replaced by plausible values, so that a valid analysis can be performed on the completed data set. A multiple imputation method is proposed based on a modification to the singular value decomposition (SVD) method for single imputation, developed by Krzanowski. The method was evaluated on a genotype × environment (G × E) interaction matrix obtained from a randomized blocks experiment on Eucalyptus grandis grown in multienvironments. Values of E. grandis heights in the G × E complete interaction matrix were deleted randomly at three different rates (5%, 10%, 30%) and were then imputed by the proposed methodology. The results were assessed by means of a general measure of performance (Tacc), and showed a small bias when compared to the original data. However, bias values were greater than the variability of imputations relative to their mean, indicating a smaller accuracy of the proposed method in relation to its precision. The proposed methodology uses the maximum amount of available information, does not have any restrictions regarding the pattern or mechanism of the missing values, and is free of assumptions on the data distribution or structure.Algumas técnicas de análise estatística multivariada só podem ser realizadas com uma matriz de dados completa, porém o processo de coleta dos dados freqüentemente leva a uma matriz com dados ausentes. A imputação é uma técnica, na qual os dados ausentes são preenchidos com valores plausíveis, para uma posterior análise na matriz completa. Neste trabalho, nós propomos um método de imputação múltipla, baseado no método da decomposição por valores singulares (DVS) para imputação simples, desenvolvido por Krzanowski, e avaliado numa matriz de interação genótipos × ambientes (G × E), proveniente de um ensaio com o delineamento aleatorizado em blocos em multiambientes com genótipos de Eucalyptus grandis. Valores da altura de E. grandis da matriz completa de interação G × E foram retirados aleatoriamente em três diferentes proporções (5%, 10%, 30%), os quais foram imputados valores dados pelo método proposto. Os resultados obtidos por meio da medida geral de exatidão ou acurácia (Tacc) mostraram um viés pequeno, em relação aos valores originais. No entanto, seus valores foram maiores do que a variabilidade dos valores imputados em relação à sua média, indicando uma exatidão ou acurácia menor do método proposto em relação à sua precisão. A metodologia proposta utiliza o maior número de informação disponível, não possui qualquer restrição quanto ao padrão e mecanismo de ausência de dados e é livre de suposição sobre a distribuição ou estrutura dos dados

    Análise AMMI com dados imputados em experimentos de interação genótipo x ambiente de algodão

    Get PDF
    The objective of this work was to evaluate the convenience of defining the number of multiplicative components of additive main effect and multiplicative interaction models (AMMI) in genotype x enviroment interaction experiments in cotton with imputed or unbalanced data. A simulation study was carried out based on a matrix of real seed-cotton productivity data obtained in trials with genotype x environment interaction carried out with 15 genotypes at 27 locations in Brazil. The simulation was made with random withdrawals of 10, 20 and 30% of the data. The optimal number of multiplicative components for the AMMI model was determined using the Cornelius test and the likelihood ratio test onto the matrix completed by imputation. A correction based on the data missing in the Cornelius procedure was proposed for testing the hypothesis when the analysis is made from averages and the repetitions are not available. For data imputation, the methods considered used robust submodels, alternating least squares and multiple imputation. For analysis of unbalanced experiments, it is advisable to choose the number of multiplicative components of the AMMI model only from the observed information and to make the classical estimation of parameters based on the matrices completed by imputation.O objetivo deste trabalho foi avaliar a conveniência de definir o número de componentes multiplicativos dos modelos de efeitos principais aditivos com interação multiplicativa (AMMI) em experimentos de interações genótipo x ambiente de algodão com dados imputados ou desbalanceados. Um estudo de simulação foi realizado com base em uma matriz de dados reais de produtividade de algodão em caroço, obtidos em ensaios de interação genótipo x ambiente, conduzidos com 15 cultivares em 27 locais no Brasil. A simulação foi feita com retiradas aleatórias de 10, 20 e 30% dos dados. O número ótimo de componentes multiplicativos para o modelo AMMI foi determinado usando o teste de Cornelius e o teste de razão de verossimilhança sobre as matrizes completadas por imputação. Para testar as hipóteses, quando a análise é feita a partir de médias e não são disponibilizadas as repetições, foi proposta uma correção com base nas observações ausentes no teste de Cornelius. Para a imputação de dados, foram considerados métodos usando submodelos robustos, mínimos quadrados alternados e imputação múltipla. Na análise de experimentos desbalanceados, é recomendável escolher o número de componentes multiplicativos do modelo AMMI somente a partir da informação observada e fazer a estimação clássica dos parâmetros com base nas matrizes completadas por imputação

    Acurácia do modelo univariado para análise de medidas repetidas por simulação multidimensional

    Get PDF
    Em experimentos com medidas repetidas, quando se utiliza o esquema de parcelas subdivididas, o teste F com relação à subparcela, só terá distribuição F exata caso a matriz de covariâncias atenda a condição de esfericidade. O objetivo deste trabalho foi verificar por meio de simulações, a acurácia da análise através da observação de casos em que a matriz de covariâncias atende, ou não, à condição de esfericidade. Quando utilizadas as matrizes de covariâncias do tipo componente de variância e simetria composta, que atendem a condição de esfericidade, a acurácia da análise foi satisfatória. O mesmo não ocorreu com outras estruturas da matriz de covariâncias. Com relação aos efeitos dos parâmetros, dependendo da grandeza dos valores dos efeitos, estes influenciam o resultado dos testes no sentido de superestimar a indicação dos mesmos, isto quando o intervalo de variação é grande.In experiments using repeated measurements, when split plot designs are utilized the F test in relation to the subplot will have an exact F distribution only if the matrix of covariance satisfies the sphericity condition. The objective of this article was to verify throught simulation the accuracy of the analysis throught the observation of some cases when the matrix of covariance satisfies or not the sphericity condition. When the matrix of covariance was of the component type of variance and of compound symmetry, the sphericity condition was satisfied and the accuracy of the analysis adequate. This does not happen with other structures of the covariance matrix. In relation to the effects of parameters, depending on the magnitude of the values of the effects, they will interfere with the results of the tests, over estimating the effects when the amplitude of the effects is large

    Cross-validation with eigenvalue correction and isotonic regression in the additive main effect and multiplicative interaction model

    Get PDF
    Neste trabalho é apresentada a aplicação dos modelos AMMI com o propósito de analisar a interação entre genótipo e ambiente em experimentos agronômicos multiambientais com dados balanceados. São apresentados dois métodos de validação cruzada e o aperfeiçoamento desses métodos por meio da correção de autovalores, sendo estes ordenados por meio da regressão isotônica. É realizado um estudo comparativo entre esses métodos por meio de dados reais. Os resultados mostram para esse conjunto de dados que o método de EASTMENT & KRZANOWSKI (1982) seleciona um modelo mais parcimonioso. Além disso, quando esse método é aperfeiçoado com a correção dos autovalores, o número de componentes não se altera. O método de GABRIEL (2002) seleciona um maior número de termos no modelo, e, quando se aplica a correção de autovalores, o número de termos diminui. O aperfeiçoamento desses métodos por meio da correção de autovalores traz um grande benefício para o pesquisador do ponto de vista prático, uma vez que a seleção do número de termos multiplicativos representa um ganho do número de blocos (ou repetições), quando se utiliza o modelo AMMI em vez do modelo completo, sendo, portanto, melhor utilizar o modelo AMMI com correção dos autovalores e selecionar o número de componentes por meio do método de Eastment e Krzanowski.This paper presents an application of AMMI models - Additive Main effects and Multiplicative Interaction model - for a thorough study about the effect of the interaction between genotype and environment in multi-environments experiments with balanced data. Two methods of crossed validation are presented and the improvement of these methods through the correction of eigenvalues, being these rearranged by the isotonic regression. A comparative study between these methods is made, with real data. The results show that the EASTMENT & KRZANOWSKI (1982) method selects a more parsimonious model and when this method is improved with the correction of the eigenvalues, the number of components are not modified. GABRIEL (2002) method selects a huge number of terms to hold back in the model, and when this method is improved by the correction of eigenvalue, the number of terms diminishes. Therefore, the improvement of these methods through the correction of eigenvalues brings a great benefit from the practical point of view for the analyst of data proceeding from multi-ambient, since the selection of numbers of multiplicative terms represents a profit of the number of blocks (or repetitions), when the model AMMI is used, instead of the complete model

    Genetic control of in vitro regeneration of Eucalyptus grandis

    Get PDF
    Com o objetivo de avaliar o controle genético da regeneração direta in vitro a partir de plântulas de Eucalyptus grandis, foram utilizadas sementes de 10 progênies de polinização aberta da população base, origem Atherton, localizada em Anhembi, Estado de São Paulo. Vinte dias de cultivo após a germinação, 196 segmentos distais dos hipocótilos por progênie foram inoculados in vitro num Delineamento em Blocos Completos Aleatorizado Generalizado, com duas unidades experimentais por bloco e sete repetições por bloco, usando a interação blocos por progênie como estimadora do erro experimental. Após 14 semanas de cultivo, foram feitas avaliações da regeneração. Houve diferenças significativas de regeneração entre as progênies (P<0,0001) com extremos de regeneração de 11% a 60%. A herdabilidade no sentido restrito entre as médias das unidades experimentais do caráter foi alta (h2m=0,94), indicando que houve um forte controle genético na regeneração in vitro dentro da população. Houve também alta variabilidade dentro da amostra estudada, assim como um forte efeito do progenitor materno sobre a regeneração.The genetic control of in vitro direct regeneration was tested on seedlings of ten open-pollinated progenies from the base population of Atherton origin of Eucalyptus grandis at University of São Paulo (Brazil). Seeds were germinated in vitro, after twenty days, distal hypocotyls segments from 196 seedlings per progeny were inoculated in culture media at Generalized Complete Randomized Block Design, with two experimental units per block and seven repetitions, using the interaction blocks by progenies as an estimate of the experimental error. At week 14 from the inoculation bud induction was evaluated. Regeneration among progenies were significantly different (P<0.0001). Regeneration varied from 11 to 60%. The narrow-sense heritability between means of experimental units for in vitro regeneration was height. (h2m=0.94), indicating a strong genetic control of the trait within the population and also a high maternal effect. High variability within the study sample was found

    Comparation of logistic regression methods and discrete choice model in the selection of habitats

    Get PDF
    Baseado em revisão mais recente de análises de dados em seleção de recurso pelos animais e com as mais recentes sugestões, que indicam a falta de uma teoria estatística unificada que mostre como a seleção do recurso pode ser detectada e medida, os autores sugerem que o conceito da função da seleção do recurso (RSF) pode ser a base do desenvolvimento da teoria. A revisão de modelos de escolha discreta (DCM) é sugerida como uma aproximação para estimar a RSF quando a escolha do animal os grupos de animais envolvem diferentes conjuntos de unidades de recurso disponíveis. A definição do RSF requer que o recurso que esteja sendo estudado consista em unidades discretas. O método estatístico frequentemente usado para estimar a RSF é a regressão logística mas DCM também pode ser usado. A teoria de DCM tem sido bem desenvolvida para análises de conjunto de dados que envolvem escolhas de produtos pelos humanos, mas também pode ser aplicável a escolhas de habitat pelos animais com algumas modificações. A comparação da regressão logística com o DCM para uma escolha é feita porque as estimativas do coeficiente do modelo de regressão logística inclui o intercepto, mas no DCM o coeficiente do intercepto não está presente. O objetivo deste trabalho foi comparar as estimativas da função da seleção do recurso obtida pela aplicação da regressão logística e o DCM do conjunto de dados de um estudo de seleção de habitat da coruja manchada (Strix occidentalis) no noroeste dos Estados Unidos.Based on a review of most recent data analyses on resource selection by animals as well as on recent suggestions that indicate the lack of an unified statistical theory that shows how resource selection can be detected and measured, the authors suggest that the concept of resource selection function (RSF) can be the base for the development of a theory. The revision of discrete choice models (DCM) is suggested as an approximation to estimate the RSF when the choice of animal or groups of animals involves different sets of available resource units. The definition of RSF requires that the resource which is being studied consists of discrete units. The statistical method often used to estimate the RSF is the logistic regression but DCM can also be used. The theory of DCM has been well developed for the analysis of data sets involving choices of products by humans, but it can also be applicable to the choice of habitat by animals, with some modifications. The comparison of the logistic regression with the DCM for one choice is made because the coefficient estimates of the logistic regression model include an intercept, which are not presented by the DCM. The objective of this work was to compare the estimates of the RSF obtained by applying the logistic regression and the DCM to the data set on habitat selection of the spotted owl (Strix occidentalis) in the north west of the United States

    Um coeficiente de correlação cofenética para o método de Tocher

    Get PDF
    The objective of this work was to propose a way of using the Tocher’s method of clustering to obtain a matrix similar to the cophenetic one obtained for hierarchical methods, which would allow the calculation of a cophenetic correlation. To illustrate the obtention of the proposed cophenetic matrix, we used two dissimilarity matrices – one obtained with the generalized quadratic Mahalanobis distance and the other with the Euclidean distance – between 17 garlic cultivars, based on six morphological characters. Basically, the proposal for obtaining the cophenetic matrix was to use the average distances within and between clusters, after performing the clustering. A function in R language was proposed to compute the cophenetic matrix for Tocher’s method. The empirical distribution of this correlation coefficient was briefly studied. For both dissimilarity measures, the values of cophenetic correlation obtained for the Tocher’s method were higher than those obtained with the hierarchical methods (Ward’s algorithm and average linkage – UPGMA). Comparisons between the clustering made with the agglomerative hierarchical methods and with the Tocher’s method can be performed using a criterion in common: the correlation between matrices of original and cophenetic distances.O objetivo deste trabalho foi propor uma forma de uso do método de Tocher para obtenção de uma matriz análoga à matriz cofenética obtida para métodos hierárquicos, o que permitiria o cálculo de uma correlação cofenética. Para ilustrar a obtenção da matriz cofenética proposta, foram utilizadas duas matrizes de dissimilaridade – uma obtida com a distância quadrada generalizada de Mahalanobis e outra com a distância euclidiana – entre dezessete cultivares de alho, com base em seis caracteres morfológicos. Basicamente, a proposta para obtenção da matriz cofenética foi a de usar, após a realização do agrupamento, as distâncias médias intra e intergrupos. Uma função em linguagem R foi proposta para computar a matriz cofenética para o método de Tocher. A distribuição empírica desse coeficiente de correlação foi estudada de forma sucinta. Para as duas medidas de dissimilaridade, os valores do coeficiente de correlação cofenética obtidos para o método de Tocher foram superiores aos obtidos com os métodos hierárquicos (algoritmo de Ward e ligação média – UPGMA). Comparações entre agrupamentos feitos com os métodos hierárquicos aglomerativos e com o método de Tocher podem ser realizadas com o uso de um critério em comum: o da correlação entre matrizes de distâncias cofenéticas e originais

    Growth in diameter of Eucalyptus grandis W. Hill. ex Maiden trees and relationship with climatic variables and mineral fertilization

    Get PDF
    Este trabalho teve como objetivo avaliar o incremento em diâmetro do tronco de árvores de Eucalyptus grandis por 24 meses e sua relação com as variáveis climáticas e fertilização mineral. As árvores foram plantadas no espaçamento de 3 x 2 m e fertilizadas com potássio e sódio (plantio, 6 e 12 meses). Foram selecionadas 20 árvores de eucalipto por tratamento, de acordo com a distribuição de área basal do povoamento e instaladas faixas dendrométricas na altura do DAP. Os resultados indicaram efeito da sazonalidade climática no incremento em diâmetro do tronco das árvores, com períodos de máximo e de mínimo crescimento e uma defasagem (lag) de 28 dias, em função da resposta da atividade cambial às variações climáticas. A aplicação de potássio em relação ao sódio e controle promoveu maior taxa de incremento acumulado do tronco das árvores, com valores de 4,14; 3,28; e 3,08 cm, respectivamente.The present work had the objective to evaluate the increment in diameter of Eucalyptus grandis trees for 24 months and its relationship with climatic variables and mineral fertilization. The trees were planted at spacing of 3x2 m and fertilized with potassium and sodium (planting, 6 and 12 months). Twenty eucalypt trees were selected by treatment according with the distribution of basal area of the plantation and dendrometer bands were fixed at DBH. The results showed a clear effect of climate seasonality on the increment of eucalypt trees, with periods of maximum and minimum growth and a delay period (lag) of 28 days, due to the response of cambial activity to climate variations. The application of potassium in relationship of sodium and control promoted greater rate of increment growth of eucalypt trees, with values of 4.14; 3.28 and 3.08 cm, respectively.Fundação de Amparo à Pesquisa do Estado de São Paulo (FAPESP)USP - Departamento de Ciências Florestais da ESAL
    • …
    corecore